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"PROCEDE ET SYSTEMS DE QUALIFICATION DE DONNEES AU SEIN 
DE DOCUMENTS PREALABLEMENT COLLECTES" 

La presente invention concerne un procede de 
qualification de donnees au sein de documents 
5 prealablement collectes. Elle vise egalement un systeme 
pour sa mise en oeuvre. 

Le developpement des supports d f informations et des 
reseaux de communications tels qu' Internet a conduit a 
une augmentation considerable des masses de donnees et 

10 d 1 informations qui peuvent etre consultees et collectees. 
Les utilisateurs de ces nouvelles techniques se trouvent 
rapidement submerges par des volumes de donnees qu'il 
devient indispensable de ranger, de classer et de 
qualifier, tout particulierement lorsqu'on souhaite 

15 effectuer des' consultations hors-ligne de ces donnees. 
Actuellement , si les internautes chevronnes peuvent 
utiliser tant bien que mal des techniques personnelles de 
classement des milliers de pages HTML collectees, il en 
va tout autrement pour les nouveaux utilisateurs 

20 d 1 Internet qui accedent a un univers de donnees qui leur 
est inconnu et ne possedent en aucun cas la dexterite et 
les "tours de main" des internautes precites. 

Le but de la presente invention est precisement de 
proposer un procede de qualification de donnees qui 

25 permette une realisation simple et rapide de livres a 
partir d 1 ensembles de documents collectes a partir de 
diverses sources d r informations . 

Ceci est obtenu avec un procede pour qualifier des 
donnees au sein de documents prealablement collectes, 

30 notamment a partir de sites connectes a un reseau de 
communication, ces documents pouvant etre consultes sous 
la forme de pages d'un livre dont ils constituent le 
contenu. II est a noter qu'il existe deja un produit 
logiciel denomme Lois (navigateur Web) qui integre une 
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presentation de documents sous la forme de pages d'un 
livre . 

Suivant 1' invention, des donnees peuvent etre 
selectionnees au sein de chaque page d'un document en 

5 cours de consultation et contenu dans un livre , de fa<jon 
a g6n6rer a partir desdites donnees selectionnees des 
outils d'acces au contenu de ce livre. 

On dispose ainsi avec le procede de qualification 
selon 1' invention d'un mode d 1 organisation et de gestion 

10 des donnees qui va bien au dela d'une simple compilation 
de pages consultees puisqu'il va devenir possible de 
traiter l 1 ensemble des donnees contenues dans les 
documents constituant un livre sous une forme globale 
grace a des outils d'acces configures pour chaque livre. 

15 Par exemple, au titre des outils d'acces, le procede 

selon I 1 invention peut comprendre une generation d'un 
index a partir des donnees mises en evidence dans un 
document, cet index signalant I 1 ensemble des pages dans 
lesquelles chacune des informations apparait. 

20 Cet index peut notamment etre genere a partir 
d r informations surlignees, mais egalement a partir 
d r informations signalees par un traitement specif ique des 
caracteres les composant. II peut comporter une zone pour 
saisir un terme a rechercher dans 1' index. 

25 Un outil d'acces au contenu des documents consiste 

en un resume genere a partir d 1 informations selectionnees 
au sein d'un document. Ce resume peut aussi etre alimente 
a partir de notes prises dans d'autres documents d'un 
livre. 

30 Le procede de qualification selon 1' invention peut 

aussi avantageusement prevoir d'associer a un document 
une ou plusieurs notes apposees sur ce document a la 
demande d'un utilisateur. Ces notes se presentent par 
exemple sous la forme d'une feuille autocollante a 

35 apposer sur un document, dans laquelle 1 ' utilisateur peut 
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saisir une portion de texte. Ces notes peuvent avoir la 
propriete d'etre transparentes , permettant ainsi de 
visualiser le contenu de la note sans pour autant masquer 
le document. La recherche dans 1' index peut d'ailleurs 

5 aussi porter sur ces notes apposees. 

Dans une version avantageuse du procede selon 
l 1 invention, il est fourni un sommaire genere a partir de 
1' ensemble des documents consultes . Chaque document 
consulte est ainsi ajoute au sommaire de fagon 

10 chronologique, une reorganisation du sommaire de fagon 
hierarchique pouvant aussi etre envisagee. En 
particulier, lorsqu'il s'agit de documents collectes sur 
un reseau de communication tel qu 1 Internet, la 
reorganisation du sommaire peut etre realisee suivant 

15 1 ' arborescence des adresses URL. 

Le procede selon l 1 invention peut en outre 
avantageusement comprendre une possibility pour un 
utilisateur de deplacer l f ensemble des liens du sommaire 
de fagon a generer sa propre arborescence, ainsi qu'un 

20 masquage d'une ou plusieurs branches de cette 
arborescence . 

Un signalement par le sommaire de documents modifies 
sur des sites distants, de documents sauvegardes 
localement ou de documents qualifies (annotations, 

25 passages surlignes dans le document) , peut en outre etre 
prevu. En pratique, le procede selon 1' invention comprend 
en outre une generation d'un dossier contenant toutes les 
pages consultees. 

Suivant un autre aspect de 1' invention, il est 

30 propose un syst^me pour qualifier des donnees au sein de 
documents prealablement collectes, notamment en visitant 
des sites connectes a un reseau de communication, mettant 
en ceuvre le procede selon 1' invention, associe a des 
moyens pour collecter des documents, des moyens pour 

35 stocker ces documents collectes, des moyens pour traiter 
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ces documents collectes et stockes et a des moyens pour 
visualiser et consulter le contenu de ces documents sous 
la forme de pages d'un livre, caracterise en ce qu'il 
comprend des moyens pour selectionner des donnees au sein 

5 des pages consultees. Ce systeme comprend en outre des 
moyens pour generer des outils d'acces au contenu des 
documents stockes au sein d'un livre, notamment un index, 
un sommaire et un resume. 

Une page blanche personnelle peut etre inseree a la 

10 position courante, afin d'accueillir des notes textuelles 
ou graphiques ou tout autre element- On peut d'ailleurs 
prevoir la possibility de mettre en oeuvre un logiciel de 
PAO pour cette page personnelle, 

D'autres particularites et avantages de l 1 invention 

15 apparaitront encore dans la description ci-apres. Aux 
dessins annexes donnes a titre d'exemples non limitatifs: 
la figure 1 represente un premier exemple de 
visualisation de documents en format "livre" par le 
procede selon 1' invention; 

20 - la figure 2 represente un second exemple de 

visualisation de documents en format "calepin" par le 
procede selon 1' invention; 

- la figure 3 represente un troisieme exemple de 
visualisation de documents en format "bloc notes" par le 

25 procede selon I 1 invention; 

- la figure 4A represente la structure d ! une base de 
donnees mise en ceuvre avec le procede selon 1' invention; 

- la figure 4B represente les modes d'acces aux 
donnees dans une base de donnees mise en oeuvre avec le 

30 procede selon 1' invention; 

- la figure 5 est une vue synoptique des fonctions 
essentielles procurees par le procede selon 1' invention. 

On va maintenant decrire des exemples de 
visualisation de documents obtenus avec le procede de 
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qualification selon 1' invention, en reference aux figures 
14 3. 

L'ecran 1 comprend deux pages respectivement gauche 
et droite PG, PD articulee autour d'une reliure RL, et un 

5 ensemble d'icones disposes par exernple sur la partie 
superieure de l'ecran. Le livre Bl ainsi visualise 
comporte un premier ensemble Oil d'onglets disposes sur 
son cote gauche et un second ensemble 012 d ! onglets 
disposes sur son cote droit. II va de soi qu ' au gre des 

10 pages tournees, les nombres respectifs d ! onglets situes 
instantanement respectivement a gauche et a droite sont 
variables. Le premier ensemble Oil d'onglets comprend un 
onglet OS "Sommaire" situe de preference au sommet de ce 
premier ensemble d'onglets et un onglet marque-page MP, 

15 tandis que le second ensemble 012 d'onglets comprend un 
onglet 01 "Index" situe de preference au bas de ce second 
ensemble d'onglets. Les pages de gauche et de droite PG, 
PD regoivent respectivement des documents actifs DG, DD. 
L'ecran 1 comprend en outre une barre de navigation BN 

20 situee par exernple sur sa partie superieure et un 
ensemble d'icones de commande EI. II est en outre pourvu 
de zones de raccourci RP, RS pour atteindre 
respectivement les pages suivantes et precedentes . 

Dans le second exernple de visualisation illustre par 

25 la figure 2, l'ecran 2 comprend une premiere page 
superieure PS et une seconde page inferieure PI contenant 
chacune des documents actifs DS, DI en cours de 
visualisation. Le calepin B2 ainsi visualise comprend un 
premier ensemble d'onglets 021 situes sur le bord 

30 superieur de la partie superieure PS et un second 
ensemble d'onglets 022 situes sur le bord inferieur de la 
partie inferieure PI. L' ensemble d'icones EI est par 
exernple dispose sur le cote droit de l'ecran 2. Le 
premier ensemble d'onglets 021 comprend par exernple un 
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onglet "sommaire" OS, tandis que le second ensemble 
d'onglets 022 comprend par exemple un onglet "index" 01. 

On peut egalement utiliser un mode de visualisation 
de type bloc-notes en reference a la figure 3, dans 
5 lequel un ecran 3 comprend un ensemble d'onglets 031 
dispose par exemple sur le bord superieur d'une page 
unique PA contenant un document actif DA en cours de 
visualisation. L 1 ensemble d'onglets 031 comprend par 
exemple un onglet "sommaire" OS, des onglets 

10 intercalaires 02-05 et un onglet d' index 01. 

Une base de donnees DB mise en oeuvre avec le procede 
selon 1' invention comprend, en reference aux figures 4A 
et 4B, un centre de documentation MS, une bibliotheque 
("bookcase") BC, des etageres BS, des livres B0, des 

15 termes indexes TI, des liens LI, des donnees DA, des 
marques de livre BM, des notes NO et des surligneurs HI. 
Elle comprend en outre des drapeaux FL, un fichier 
d'acces AC, des drapeaux LS pour determiner des niveaux 
de securite, une table de temps TT, un journal 

20 d'evenements LO, des utilisateurs US, des groupes 
d 1 utilisateurs GR, des relations entre groupes et 
utilisateurs GU et un identifiant d'acces unique OA. 

Le Centre de media ou de documentation MS, appele 
aussi dans la suite MediaCenter, est le paradigme logique 

25 d'un centre de documentation. II permet d 1 identifier les 
grandes sources d 1 informations . A titre d' exemple non 
limitatif, au sein d'une entreprise, il est possible 
d'implanter plusieurs serveurs de bases de donnees qui 
peuvent etre ainsi consultes indif f eremment . Le 

30 MediaCenter regroupe l 1 ensemble des bibliotheques appele 
dans la suite Bookcase. 

Le BookCase est un espace de rangement pour un grand 
nombre de livres regroupes logiquement par un 
utilisateur. C'est le paradigme du meuble que represente 

35 une bibliotheque. II est associe a un unique MediaCenter. 
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Le Bookshelf est le paradigme d'une etagere. II 
permet de regrouper thematiquement un ensemble de livres. 
II n'existe aucune limite logique du nombre de livres. 
Seule la representation a 1'ecran d'une etagere dans la 
5 bibliotheque peut limiter leur nombre. 

Les livres sont ranges dans des etageres et peuvent 
etre deplaces dans n'importe lequel des elements 
hierarchiques precites . 

Les MediaCenters peuvent etre des elements 
10 partageables sur le Web. Un utilisateur navigant sur 
Internet peut decider de consulter une bibliotheque 
d 1 information . II peut ainsi passer d ! un MediaCenter dans 
un autre MediaCenter. 

L 1 ensemble des mots indexes peut etre regroupe sous 
15 la forme d'un livre general des index afin de permettre 
une recherche sur 1' ensembles des livres. 

On va maintenant decrire des exemples de gestion des 
droits d'acces aux informations dans le cadre du precede 
selon 1' invention. On definit un ensemble de services 
20 permettant 1 1 administration des droits d'acces aux 
informations . 

Chaque document possede une liste de lecteurs et de 
groupes de lecteurs ayant des droits specifiques sur ce 
document. Les ressources poss^dent des droits attribues 
25 aux utilisateurs . Des droits peuvent etre associes a: 

- des centres de documentation (MediaCenter) , 

- des bibliotheques (Bookcase) , 

- des groupes de livres ou etageres (Bookshelf) , 

- des livres, 

30 - des sections ou chapitres, 

- des documents (ou liens) d'un livre. 

Les droits suivants peuvent etre appliques: 

- lecture, 

- ecriture, 



WO 98/55914 



PCT/FR97/00983 



- ajout (d*un livre pour des groupes de livres, d'un 
document pour des livres) , 

- appropriation (d'un groupe de livres, d'un livre, 
d 1 un document) , 

5 - backup, 

- plages horaires (Timetable) . 

Un utilisateur autorise a supprimer un groupe de 
livres ne peut pas pour autant supprimer les documents 
d'un livre, sauf s'il lui a ete explicitement donne ce 
10 droit. 

La propriete d ! un element n ! implique pas 1' ensemble 
des droits disponibles mais la possibilite de modifier 
n'importe quel droit de cet element. Un administrateur a 
un droit d f appropriation sur tous les elements de la 

15 bibliotheque. La notion de propriete permet d' identifier 
n'importe quel utilisateur s'etant approprie un document. 

Le droit de backup n'implique pas le droit de 
lecture: un operateur specif ique peut detenir ce droit 
sans pour autant etre autorise a consulter les donnees. 

20 Les horaires permettent de limiter l'acces a des 

informations, par exemple par analogie avec les horaires 
d'ouverture d'une bibliotheque. 

Seuls des operateurs crees par 1 1 administrateur ont 
la possibilite de creer des lecteurs et des groupes de 

25 lecteurs. On peut definir pour les operateurs les droits 
suivants : 

- ajout d 1 utilisateurs 

- suppression d r utilisateurs , 

- suppression de lecteurs qu'ils ont crees, 

30 - suppression de groupes de lecteurs qu'ils ont 

crees, 

- suppression de lecteurs, 

- suppression de groupes de lecteurs. 
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II existe un groupe administrateur dont les membres 
ont les memes droits que 1 1 administrateur . 
L 1 administrateur ne peut jamais etre supprime. 

On peut egalement prevoir d'attribuer une duree de 

5 vie aux donnees qui est repercutee au travers du champ 
ExpirationDate de la base de donnees. L ' introduction de 
cette duree de vie permet de resoudre des problemes de 
confidentiality, de capacite de stockage et de 
conservation des donnees pertinentes. Elle renforce 

10 egalement le paradigme du livre etant donne que les 
lecteurs sont habitues a lire des quotidiens, des 
hebdomadaires, des mensuels. 

Les utilisateurs et les groupes d 1 utilisateurs 
possedent egalement une duree de vie permettant de 

15 restreindre pendant a certaine duree les droits de 
certains utilisateurs. Par ailleurs, il est possible de 
fixer une date d f expiration des mots de passe des 
utilisateurs pour les forcer a renouveler leurs mots de 
passe et accroitre ainsi la securite . 

20 On va maintenant decrire les fonctions essentielles 

procurees par le procede selon 1' invention, en reference 
a la figure 5. Des informations sont collectees (CO) sur 
le Web/Internet, sur un reseau Intranet ou sur des 
supports d f informations tels que des CD-ROM. Ces 

25 informations ou documents sont ensuite classes (CD) pour 
etre ranges dans des livres B disposes sur des etageres 
BS, au sein d'une bibliotheque BI . Lorsqu'un utilisateur 
souhaite consulter un document, le livre B contenant ce 
document est extrait de la bibliotheque et est ouvert 

30 afin de permettre une visualisation VI des pages de ce 
livre. Ainsi , on peut visualiser une page gauche PG et 
une page droite PD pouvant tourner autour d'une reliure 
RL, ces pages etant eventuellement pourvues d'onglets OG, 
OD. Sur les pages des documents, 1 1 utilisateur peut a son 
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gre surligner (MS) des mots ou des extraits du document, 
ou apposer des notes NP. 

Au cours de la constitution du livre, le procede 
selon 1' invention inclut les fonctions suivantes: 
5 - generation GS d'un sommaire SO; 

- generation GR d'un resume SU; 

- generation GI d'un index IN. 

Le suriigneur a pour fonction de permettre une mise 
en relief d 1 informations par 1 1 utilisateur . Ainsi, en 

10 consultant a nouveau un document, il peut voir plus 
facilement ce qui 1'interesse. Cette fonction permet 
egalement de faire partager des informations cles a 
d'autres utilisateurs, notamment dans une architecture 
Intranet. Les mots surlignes servent aussi a la creation 

15 d'un index. 

Le resume est un document genere a partir d r elements 
surlignes et de notes prises dans d'autres documents du 
livre. 

Le sommaire est genere a partir de 1' ensemble des 

20 documents consultes . Chaque document consulte est ajoute 
au sommaire de fagon chronologique . Un utilisateur peut 
acceder au sommaire a tout moment de la consultation. II 
peut demander la reorganisation du sommaire de fagon 
hierarchique, par exemple suivant 1 1 arborescence des 

25 adresses URL dans le cas de documents preleves sur 
Internet. L 1 ensemble des liens du sommaire peut etre 
deplace par 1 1 utilisateur de maniere a generer sa propre 
arborescence. Toute branche de cette arborescence peut 
etre masquee. Le sommaire est capable de signaler a 

30 1 'utilisateur les documents modifies sur des sites 
distants. Un dossier special appele "pages non classees" 
contient toutes les pages consultees. 

Chaque document telecharge et appartenant au sommaire 
est analyse pour en extraire des mots cles. Ces mots cles 

35 permettent de generer un index. lis sont mis en relief 
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dans un document soit par des fonctions de caractere 
(Gras, Italique, . . . ) ou en utilisant la fonction de 
surlignage. 

L f index signale 1' ensemble des pages ou chacun des 
5 mots cles apparait, meme s'il a ete mis en relief dans un 
seul document. 

L ! index dispose d'une zone de saisie qui permet de se 
placer instantanement sur le terme recherche dans 
I 1 index- Cette zone de saisie peut egalement permettre 

10 une recherche plus complete dans 1' ensemble du livre. 
Dans ce cas la, un nouveau document contenant le resultat 
de la recherche est ajoute au livre. 

Un utilisateur peut associer a un document une ou 
plusieurs notes qui sont positionnees au gre de 

15 1 1 utilisateur. sur le document. Lors d'une recherche dans 
I 1 index, il est possible de specifier que la recherche 
s'effectue aussi dans les notes, ou bien uniquement dans 
les notes. Les notes se presentent sous la forme d'une 
feuille autocollante dans laquelle 1 1 utilisateur peut 

20 saisir une portion de texte. 

II est a noter que le procede de qualification selon 
1' invention peut etre associe a tout procede d' edition et 
d* impression permettant de realiser physiquement de vrais 
livres, calepins ou bloc-notes ou tout autre support 

25 materiel. Par ailleurs, le procede de qualification selon 
I 1 invention peut prendre en compte toute applette 
applicative disponible dans le domaine du multimedia. 

Bien sur, I 1 invention n'est pas limitee aux exemples 
qui viennent d'etre decrits et de nombreux amenagements 

30 peuvent etre apportes a ces exemples sans sortir du cadre 
de 1' invention. Ainsi, d ! autres outils que ceux qui 
viennent d'etre decrits peuvent etre mis en oeuvre pour la 
qualification des donnees. II est a noter que les donnees 
et documents concernes par la presente invention peuvent 

35 etre d'origine quelconque et avoir ete collectees sur des 
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reseaux de communications ouverts tels qu* Internet ou 
prives (Intranet), ou encore sur des supports 
d* informations de toute nature (CD-ROM, DVD-ROM, etc..) . 
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REVENDI CAT IONS 

1. Procede pour qualifier des donnees au sein de 
documents prealablement collectes, notamment a partir de 
sites connectes a un reseau de communication, ces 

5 documents pouvant etre consultes sous la forme de pages 
d'un livre dont ils constituent le contenu, caracterise 
en ce que des donnees peuvent etre selectionnees au sein 
de chaque page d'un document en cours de consultation et 
contenu dans un livre, de fagon a generer a partir 
10 desdites donnees selectionnes des outils d'acces au 
contenu de ce livre. 

2. Procede selon la revendication 1, caracterise en ce 
qu'il comprend, au titre des outils d'acces, une 

15 generation d'un index a partir des donnees selectionnees 
dans un document, cet index signalant 1' ensemble des 
pages dans lesquelles chacune des informations apparait. 

3. Procede selon la revendication 2, caracterise en ce 
20 que 1 ' index est genere a partir d ' informations 

surlignees . 

4. Procede selon l'une des revendications 1 ou 2, 
caracterise en ce que 1' index est genere egalement par 

25 des informations signalees par un traitement specifique 
des caracteres les composant. 

5. Procede selon l'une des revendications 2 a 4, 
caracterise en ce que l 1 index comporte une zone pour 

30 saisir un terme a rechercher dans 1' index. 

6. Procede selon l'une quelconque des revendications 
precedentes, caracterise en ce qu'il comprend en outre 
une generation d'un resume a partir d ' informations 

35 selectionnees au sein d'un document. 
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7. Procede selon la revendication 6, caracterise en ce 
que le resume est genere a partir d 1 informations 
surlignees . 

8. Procede selon l'une des revendications 6 ou 7, 
caracterise en ce que le resume est genere a partir de 
notes prises dans d'autres documents d'un livre. 



10 9. Procede selon l'une quelconque des revendications 
precedentes, caracterise en ce qu'on associe a un 
document au moins une note apposee sur ce document a la 
demande d'un utilisateur. 

15 10. Procede selon la revendication 9, caracterise en ce 
que les notes se presentent sous la forme d'une feuille 
autocollante a apposer sur un document, dans laquelle 
1 r utilisateur peut saisir une portion de texte. 



20 11. Procede selon l'une des revendications 2 a 5 et l'une 

des revendications 9 ou 10, caracterise en ce que la 

recherche dans 1' index peut porter aussi sur les notes 
apposees . 

25 12. Proc£de selon l'une des revendications 2 a 5 et l'une 

des revendications 9 ou 10, caracterise en ce que la 

recherche dans 1' index porte uniquement sur -les notes 
apposees . 



30 13. Procede selon l'une quelconque des revendications 
pr&cedentes , caracterise en ce qu'il comprend -en outre 
une generation d'un sommaire a partir de 1' ensemble des 
documents consultes . 
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14. Procede selon la revendication 13 , en ce que chaque 
document consul te est ajoute au sommaire de fagon 
chronologique . 

5 15. Procede selon l'une des revendications 13 ou 14, 
caracterise en ce qu'il comprend en outre une 
reorganisation du sommaire de fagon hierarchique . 

16. Procede selon la revendication 15, applique a des 
10 documents preleves sur un reseau de communication tel 
qu 1 Internet, caracterise en ce que la reorganisation du 
sommaire est realisee suivant 1 * arborescence des adresses 
URL. 

15 17. Procede selon 1 1 une des revendications 13 a 16, 
caracterise en ce qu'il comprend en outre une possibility 
pour un utilisateur de deplacer 1' ensemble des liens du 
sommaire de fagon a generer sa propre arborescence. 

20 18. Procede selon la revendication 17, caracterise. en ce 
qu'il comprend en outre un masquage d'une ou plusieurs 
branches de cette arborescence. 

19. Procede selon l'une quelconque des revendications 13 
25 a 18, caracterise en ce qu'il comprend en outre, un 

signalement par le sommaire de documents modifies sur /des 
sites distants. 

20. Procede selon l'une quelconque des revendications 
30 precedentes, caracterise en ce qu'il comprend en outre 

une generation d'un dossier contenant toutes les pages 
consultees . 

21. Procede selon l'une quelconque des revendications 
35 precedentes, caracterise en ce qu'il comprend en outre 
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une attribution de durees de vie predetermines a des 
documents contenus dans un livre. 

22. Systeme pour qualifier des donnees au sein de 
5 documents prealablement collectes, notamment en visitant 

des sites connectes a un reseau de communication, mettant 
en ceuvre le procede selon l'une quelconque des 
revendications precedentes, associe a des moyens pour 
collecter des documents, des moyens pour stocker ces 

10 documents collectes, des moyens pour traiter ces 
documents collectes et stockes et a des moyens pour 
visualiser et consulter le contenu de ces documents sous 
la forme de pages d'un livre, caracterise en ce qu'il 
comprend des moyens pour selectionner des donnees au sein 

15 des pages consultees. 

23. Systeme selon la revendication 22, caracterise en ce 
qu'il comprend en outre des moyens pour generer des 
outils d'acces au contenu des documents stockes au sein 

20 d'un livre, notamment un index et un resume. 

24. Systeme selon 1 1 une des revendications 22 ou 23, 
caracterise en ce qu'il comprend en outre des moyens pour 
generer un sommaire indiquant 1" ensemble des documents 

25 consultes qui constituent un livre. 

25. Application du procede et du systeme de qualification 
de donnees selon I'une quelconque des revendications 
precedentes au rangement et a la consultation de 

30 documents collectes au cours d'une navigation sur un 
reseau de communication, notamment le reseau Internet. 
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(54) Method and system for data designation in pre-collected 
documents 

(57) ABSTRACT 

The invention concerns a method for data designation in pre- 
collected documents, in particular from sites connected to a 
communication network, the said document being consulted in the form 
of pages of a book of which they comprise the content. Data or 
information can be selected within each page of a document during the 
retrieval process and contained in a book, in order to generate from 
this selected data access tools to the content of this book, * 
especially an index, table of contents or summary. The method is 
useful especially for off-line retrieval of documents gathered on the 
web. 

The present invention pertains to a method of designating data 
within pre-collected documents. It also envisages a system for its 
implementation . 

The development of information media and communication networks 
such as the Internet has led to a great increase of data and 
information that can be consulted and collected. The users of these 
new techniques are quickly drowned in volumes of data that one must 
rank, classify and designate, especially when one desires to make 
off-line consultations of these data. Presently, while experienced 
internet users can use fairly well personal techniques for 
classifying thousands of collected HTML pages, this is not true for 
new internet users who access a data universe that is unknown tp them 
and who in any case do not have the skill and knack of the 
aforementioned internet users. 



* Number in the margin indicates pagination in the foreign text. 



The aim of the present invention is to propose a method of 
designating data that will allow simple and quick building of* books 
from sets of documents collected from various information sources. 

This is achieved with a method of designating within pre- 
collected documents, especially from sites connected to a 
communication network, these documents that can be consulted in the 
form of pages of a book of which they comprise the contents. One 
should note that there is already a software product called Lois (web 
navigator) that integrates a presentation of documents in the form of 
pages of a book. 

According to the invention data can be selected within each page 
of a document during consultation and contained in a book, so' as to 
generate from the said selected data some access tools to the 
contents of this book. 

One thus obtains with the method of designation according to the 
invention a means of organization and management of data that goes 
well beyond a simple compilation of consulted pages since it becomes 
possible to process all the data contained in the documents 
comprising a book in a global form thanks to some access tools 
configured for each book. 

For example, as access tools the method according to the 
invention can include generation of -an index from data presented in a 
document, this index indicating all of the pages in which the 
information appears. This index can be generated in particular from 



highlighted information, but also from data indicated by specific 
treatment of the characters comprising it. It can include an area 
for capturing a term to be searched in the index. 

An access tool to the contents of the documents consists in a 
summary generated from information selected within a document. This 
summary can also be supplied from notes taken in other documents of a 
book . 

The designation method according to the invention can also 
advantageously provide for combining with a document one or several 
notes appended to this document at the request of a user. These 
notes are present for example in the form of a self L stick sheet to be 
attached to a document, in which the user can capture a text 
portion. These notes can have the property of being transparent, 
thus allowing one • to visualize the contents of the note without 
having to cover up the document. The search in the index can also 
pertain to these attached notes. 

In a preferred version of the method according to the invention 
a table of contents is furnished from the set of consulted documents. 
Each consulted document is thus added to the table of contents 
chronologically, a new organization of the table of contents in 
hierarchical manner thus being envisaged. In particular, when one is 
concerned with collected documents on a communication network such as 
the Internet the re-organization of the table of contents can be done 
based on the tree diagram of the URL addresses. 
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The method according to the invention can additionally 
advantageously include the possibility for the user to move the set 
of links of the table of contents so as to generate his own tree 
diagram, as well as a masking of one or several branches of this tree 
diagram. 

A description by the table of contents of modified documents to 
remote sites, of locally protected documents or of designated 
documents (annotations, highlighted passages in the document), can 
also be provided. In practice the method according to the invention 
includes moreover , the generation of a report containing all the 
consulted pages. 

According to another feature of the invention a system is 
proposed for designating data within pre-selected documents, • 
especially by visiting sites connected to a communication network, 
implementing the method according to the invention, combined with 
some means for collecting documents, means for processing these 
collected documents and stored and with some means for visualizing 
and consulting the content of these documents in the form of pages of 
a book, characterized in that it includes means for selecting data 
within the consulted pages. This system also includes means for 
generating access tools to the contents of the documents stored in a 
book, especially an index, a table of contents and a summary. 



A personal blank page can be inserted in the current position in 
order to gather text or graphic notes or any other element. One can 
also provide the possibility of using PAO (publication) software for 
this personal page. 

Other particular features and advantages of the invention will 
be apparent from the following description. - In the attached drawings 
that are given as non-limiting examples: 

• Figure 1 shows a first example of visualization of 
documents in "book" format by the method according .to the 
invention; 

• Figure 2 shows a second example of visualization of 
documents in "notebook" format by the method according to 
the invention; 

• Figure 3 shows a third example of visualization of 
documents in "block notes" format by the method according 
to the invention; 

• Figure 4A shows the structure of a data base used with the 
method according to the invention; 

• Figure 5 is a block diagram view of the essential functions 
achieved by the method according to the invention. 

We shall now describe some examples of document visualization 
obtained with the method of designation according to the invention, 
with reference to Figs. 1 to 3 . 



Screen 1 includes two left and right side pages PG, PD 
respectively that are joined to a binding RL, and a set of icons 
arranged for example on the upper part of the screen. The book Bl 
thus visualized includes a first set Oil of tabs arrange on its left 
side and a second set 012 of tables arranged on its right sidei It 
is obvious that as the pages are turned the respective number's of 
tabs located instantaneously on the left and right respectively are 
variable. The first set Oil of tables includes a table OS "table of 
contents" located preferably at the top of this first set of tabs and 
a page marker MP, while the second set 012 of tabs includes a tab 01 
"Index" located preferably at the bottom of this second set of tabs. 
The pages of the left and right PG, PD receive respectively active 
documents DG, DD. ■ The screen 1 includes also a navigation strip BN 
located for example on its upper part and a set of command icons El. 
Shortened zones RP, RS are also provided for reaching the next and 
preceding pages respectively. 

In the second example of visualization shown by Fig. 2 the 
screen 2 includes a first upper page PS and a second lower page PI 
that each contain some active documents DS, DI in course of 
visualization. The notebook B2 thus visualized includes a first set 
of tabs 021 located on the upper edge of the upper part PS and a 
second set of tabs 022 located on the lower edge of the lower part 
PI. The set of icons EI is for example arranged on the right side of 



screen 2. The first set of tabs 021 includes for example a "table of 
contents" tab OS, while the second set of tabs 022 includes for 
example a tab "index" 01. 

One can also use a mode of visualization of the block notes kind 
with reference to Fig. 3, in which a screen 3 includes a set of tabs 
031 arranged for example on the upper edge of a single page PA that 
contains an active document DA in the course of visualization. The 
set of tabs 031 includes for example a tab "table of contents" OS , 
some interleaf ed tabs 02-05 and an index tab 01. 

A database DB used with the method according to the invention 
includes, with reference to Figs. 4A and 4B, a documentation center 
MS, a bookcase BC, some shelves BS, some books BO, some indexed terms 
TI, some links LI, some data DA, some bookmarks BM, some notes NO and 
some highlighters HI. It also includes some flags FL, an access card 
catalog AC, some flags LS for determining security levels, a 
timetable TT, an event log LO, some users US, some user groups GR, 
some relationships between groups and users GU and a unique access 
identifier OA. 

The media or documentation center MS, called also later the 
MediaCenter suite, is the logical paradigm of a documentation center. 
It allows one to identify the large information sources. As a non- 
limiting example, within a company, it is possible to install several 
data base servers that can be consulted indiscriminately. The 
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MediaCenter gathers together the set of bookcases called later 
Bookcase . 

The Bookcase is a storage space for a large number of* books 
grouped logically by a user. It is the furniture paradigm that a 
bookcase represents. It is associated with a unique MediaCenter. 

The Bookshelf is the paradigm of a bookshelf. It allows one /J7 
to gather thematically a set of books. There is no logical limit to 
the number of books. Only the representation on the screen of a ■ 
shelf in the bookcase can limit their number. 

The books are arranged in shelves and can be moved in any of the 
aforementioned hierarchical elements. 

The MediaCenters can be some sharable elements on the Web. A 
user navigating on the Internet can decide to consult a library of 
information. He can thus go from one MediaCenter into another 
MediaCenter. 

The set on indexed words can be regrouped in the form of a 
general book of indexes in order to allow a search on the sets of 
books . 

We shall now describe some examples of management of the rights 
of access to information as part of the method according to the 
invention. We shall define a set of services that allow the 
administration of access rights to information. 
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Each document has a list of readers and groups of readers having 
specific rights to this document. The sources have rights attributed 
to users. Some rights can be associated with: 

• Documentation centers (MediaCenter ) ; 

• Bookcases (BookCase) ; 

• Groups of books or shelves (Bookshelf); 

• Books, 

• Sections or chapters; 

• Documents (or links) of a book. 

The following rights can be applied: 

• Reading; 

• Writing; 

• Adding (one book for groups of books, one document for 
books) ; 

• Appropriation (one group of books, one book, a 
document) , 

• Backup; 

• Time ranges (Timetable) . 

A user authorized to prohibit a group of books cannot however 
prohibit the documents of a book, unless he is explicitly given this 
right . 
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The ownership of an element does not imply the set of rights 
available but the possibility of modifying any right whatsoever of 
this element. An administrator has a right of appropriation to all 
the elements of the library. The idea of ownership allows one to 
identify any user who is appropriate for a document. 

The right of backup does not imply the right of reading: a 
specific operator can hold this right without necessarily being 
authorized to consult the data. 

The clocks allow one to limit access to information; for example 
by analogy with the open hours of a library. 

Only the operators created by the administrator have the 
opportunity to create readers and groups of readers. One can define 
for operators the following rights: 

• Adding users; 

• Restricting users; 

• Restricting readers that they have created; 

• Restricting groups of readers that they have created; 

• Restricting readers; 

• Restricting groups of readers. 

There is an administrative group whose members have the same /_9 
rights as the administrator. The administrator can never be 
restricted . 
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One can also attribute a lifetime to the data that is propagated 
through the field ExpirationDate of the database. The insertion of 
this lifetime allows one to solve problems of confidentiality, 
storage capacity, and preservation of pertinent data. It reinforces 
also the paradigm' of the book since the readers are accustomed to 
read dailies, weeklies, and monthlies. 

The users and the user groups also have a lifetime that allow 
one to restrict for a certain time the rights of some users. In 
addition, it is possible to set an expiration date of the passwords 
of the users to force them to renew their passwords and thus increase 
security. 

We shall now describe the essential functions obtained by the 
method according to the invention, with reference to Fig. 5. 
Information is collected (CO) on the Web/Internet, on an Intranet 
network or on some information media such as CD-ROM. This 
information or documents are then classified (DC) in order to be 
stored in books B arranged on shelves BS, within a library BI. When 
a user wishes to consult a document,* the book B containing this 
document is retrieved from the library and is opened in order to 
allow a visualization VI of the pages of this book. Thus, one can 
visualize a left page PG and a right page PD that can turn about a 
binding RL, these pages being possibly with tabs OG, OD. On the 
pages of the documents the user can at his liking highlight (MS) some 
words or excerpts of the document, or attach some notes NP . 
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During the building of the book the method according to the 
invention includes the following functions: 

• Generation GS of a table of contents SO; 

• Generation GR of a summary SU; 

• Generation GI of an index IN. 

The highlighter has the function of allowing the highlighting of 
information of information by the user. Thus, when consulting a 
document again he can see more easily what he is interested in.- This 
function lets one also share key information with other users, 
especially in an Intranet architecture. The highlighted words are 
also used for the creation of an index. 

The summary is a document generated from highlighted elements 
and notes made in other documents of the book. 

The table of contents is generated from the set of consulted 
documents. Each consulted document is added to the table of contents 
chronologically. A user can have access to the table of contents at 
any time of the consultation. He can request reorganization of the 
table of contents hierarchically, for example according to the tree 
diagram of the URL addresses in the case of documents obtained on the 
Internet. The set of links of the table of contents can be moved by 
the user so as to generate its own tree diagram. Any branch of this 
tree diagram can be masked. The table of contents is capable of 
indicating to the user the modified documents on remote sites. A 
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special report called u unclassif ied pages" contains all the consulted 
pages . 

Each remotely loaded document and belonging to the table of 
contents is analyzed in order to extract some key words from it. 
These key words let one generate an index. They are emphasized in a 
document by some character functions (bold, italics, ...) or by /ll 
using the highlighting function. 

The index indicates the set of pages where each of the key words 
appears, even if it was emphasized in a single document. 

The index makes available a capture zone that lets one move 
instantaneously to the search phrase in the index. This capture zone 
can also allow a more complete search in the entire book. In this 
case a new document containing the result of the search is added to 
the book. 

A user can associate with a document one or several notes that 
are positioned to the liking of the user on the document. During a 
search in the index, it is possible to specify that the search is 
being done also in the notes, or only in the notes. The notes are 
presented in the form of a self -attaching sheet in which the user can 
capture a text portion. 

One should note that the designation method according to the 
invention can be combined with any publishing and printing method to 
physically produce true books, notebooks or notepads or any other 
real medium. In addition the designation method according to the 
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invention can consider any application available in the multimedia 
field. 

Of course the invention is not limited to the examples that have 
just been described and many variations can be made to these examples 
without departing from the scope of the invention. Thus, other tools 
that those just described can be employed for the designation of 
data. One should note that the data and documents in question by the 
present invention can be of any origin whatsoever and might have been 
collected on open communication networks such as the Internet or /12 
private one (Intranet), or even on some information, media of any kind 
(CD-ROM, DVD-ROM, and so forth) . 

CLAIMS /13 

1. Method for designating data within pre-collected documents, 
especially from sites connected to a communication network, these 
documents capable of being consulted in the form of pages of a book 
of which they comprise the contents, characterized in that the data 
can be selected within each page of a document in the course of 
consultation and contained in a book, so as to generate from the said 
selected data access tools to the contents of this book. 

2. Method according to Claim 1 characterized in that it includes 
as access tools the generation of an index from data selected in a 
document, this index indicating the set of pages in which each of the 
information appears. 
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3. Method according to Claim 2 characterized in that the index 
is generated from highlighted information. 

4. Method according to Claims 1 or 2 characterized in that the 
index is generated also by some information indicated by specific 
treatment of the characters that make it up. 

5. Method according to one of the Claims 2 to 4 characterized in 
that the index includes a zone for capturing a phrase to search in 
the index . 

6. Method according to any of the preceding claims characterized 
in that it includes in addition the generation of a summary from 
information selected in a document. 

7. Method according to Claim 6 characterized in that the 714 
summary is generated from highlighted information. 

8. Method according to one of the Claims 6 or 7 characterized in 
that the summary is generated from notes taken in other documents of 
a book. 

9. Method according to any of the preceding claims characterized 
in that one associated with a document at least one note attached to 
this document at the request of a user. 

10. Method according to Claim 9 characterized in that the notes 
are present in the form of a self -attaching sheet to be posted on a 
document in which the user can capture a text portion. 
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11. Method according to one of the Claims 2 to 5 and one of the 
claims 9 or 10 characterized in that the search in the index can 
pertain also to the posted notes. 

12 . Method according to one of the Claims 2 to 5 and one of the 
claims 9 or 10 characterized in that the search in the index pertains 
only to the posted notes. 

13. Method according any of the preceding claims characterized 
in that it includes in addition the generation of a table of contents 
from the set of consulted documents; 

14. Method according to Claim 13 characterized in that each /15 
consulted document is added to the table of contents chronologically. 

15. Method according to one of the Claims 13 or 14 characterized 
in that it includes in addition a reorganization of the table of 
contents hierarchically . 

16. Method according to Claim 15 applied to documents obtained 
in a communication network such as the Internet, characterized in 
that the reorganization of the table of contents is done according to 
the tree diagram of the URL addresses. 

17. Method according to one of 'the Claims 13 to 16 characterized 
in that it includes in addition the possibility for a user to move 
the set of links from the table of contents so as to generate his own 
tree diagram. 
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18. Method according to Claim 17 characterized in that it 
includes in addition a masking of one or several branches of this 
tree diagram. 

19. Method according any of the Claims 13 to 18 characterized in 
that it includes in addition reference by the table of contents of 
modified documents to some remote sites. 

20. Method according to any of the preceding claims 
characterized in that it includes in addition generation of a report 
containing all the consulted pages. 

21. Method according to any of the preceding claims 
characterized in that it includes in addition an attribution of 
predetermined lifetimes to some documents contained in a book. 716 

22. System- for designating data within pre-collected documents, 
especially by visiting sites connected to a communication network, 
using the method according to the invention based on any of the 
preceding claims, combined with some means for collecting documents, 
means for storing these collected documents, some means for 
processing these collected and stored documents and some means for 
visualizing and consulting the contents of these documents in the 
form of pages of a book, characterized in that it includes some means 
for selecting data within the consulted pages. 

23. System according to Claim 22 characterized in that it 
includes in addition some means for generating access tools to the 
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contents of the documents stored in a book, especially an index and a 
summary. 

24. System according to one of the Claims 22 or 23 characterized 
in that it includes in addition some means for generating a table of 
contents indicating the set of consulted documents that comprise a 
book. 

25. Application of the method and system of data designation 
according to any of the preceding claims for orderly arrangement and 
consultation of documents collected in the course of navigation on a 
communication network, especially the Internet network. 
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Figure 5. Key: 1-table of contents; 2-media; 3-intranet; 4- 
web/internet ; 5-summary; 6-index, type in the word to be searched, 
terrestrial . 
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